根據《哈佛商業評論》分享的一項報告數據,“低效率的合約管理流程會導致公司在特定交易中損失 5% 到 40% 的價值。”,也因此,更好的合約管理可以提高效率、生產力並節省成本。在這個流程當中,審查法律合約書更是其中一項被律師事務所助理稱作是最重複和乏味的工作之一。
審查法律合約書是一個在簽署合約之前,了解個人或公司的權利和義務,並針對該合約評估相關影響的過程。也因為如此,重複性高(有一定的模式)、且需要優化工作流程的情境,就會是機器學習專案進來幫忙的時候了。
當談到審查法律合約書,律師的工作是手工審核數以百計的合約書,以找到相關的條款或義務在合約規定的頁面。當中重複的事項則是在這個審查的過程,會需要找一些固定的欄位、資料。像是:合約本身的標題以及界線?合約的生效日期?續訂條款是什麼?合約的當事人有哪些?法律效力包含哪些?
以下圖為例,合約的典型文件結構,以及感興趣的欄位:
*圖片來源:Machine Learning for Contracts Analysis
這些過程都是以人工進行,且需審核的文件頁數也是相當多,過程需耗費非常多的時間與體力。也可能因為長時間審閱的疲倦而出現人為錯誤。若是將法律合約書審核這樣的情境延伸,包含律師事務所、政府機構、人力資源經理、房地產經紀人(等等)都面臨著這些相同的挑戰。然而,面對這些挑戰,也不是所有的機構、公司組織都會把文檔數位化、分門別類儲存,讓審閱者可以在過程當中交叉搜索文件。
以摩根大通的 AI 程序 COIN為例,該服務在短短幾秒鐘內完成了 360,000 小時的律師工作。這背後來自於透過機器學型模型,對於文件的標記以及分類,註記關鍵資料等等。其帶來的好處包含:(1)使合約檔案可搜索(2)加速合約審閱(3)彰顯合約風險(4)讓審閱流程可追蹤、可視化。
可搜索這件事情,讓審查工作帶來的疲倦程度降低許多,藉著數位化的儲存與管理,加上機器學習的文件分類與識別,讓搜尋過程方便許多。加上文件語意分析,讓搜尋本身的情境可以更廣泛。
透過文件的語意分析,審閱者可以更快速的收集到相關訊息,並在審核過程當中參考。這些資料也可以提供審閱者觀察近期是否有哪些合約雷同、或是具有哪些趨勢變化等等。
在合約的審核過程當中,若是有淺在的風險,或是沒有敘述完整的狀況,都可以透過機器學習的模型找到,並將其發送給相關同事,以進行複查或者修改。
透過數位化、機器學習的協助,讓審閱合約這件事情的流程透明度提高許多,進而可以分析審閱的時間,近期審閱的主題等等。讓公司本身的業務狀況也可以與審閱流程一起統整。
若是今天在公司內需要展開機器學習專案,想在那之前了解一下,專案所需的資料應該要長什麼樣子。可以參考CUAD資料集,該資料集由 500 多個合約組成,每個合約都經過法律專家的標記。當中包含 41 種不同類型的重要條款,共計 13,000 多個註釋。除了資料及之外,這個團隊也發佈了相關的 Transformer 模型。這些資料與模型都是可以直接從網路上下載的。
透過參考這些專案,知道(1)文件可以怎麼標記(2)有哪些相關的文本分析模型可以使用(3)常見的語言模型有哪些限制。
舉例來說這兩篇文章[4][5]就在探討,該文本分析僅可應用於512字以下的文本,若是這個狀況可以怎麼克服。這些情境也可能會發生在其他的文本分析上,不僅是法律相關合約。
Reference
[1]. Machine Learning for Contracts Analysis — Put Your Human Mind Where It Really Matters.
[2]. How Has Machine Learning and AI Contract Review Software Changed Contracts
[3]. How AI is Revolutionizing the Contract Review Process
[4]. How to Set up a Machine Learning Model for Legal Contract Review
[5]. How to Set up a Machine Learning Model for Legal Contract Review - Part2